Ví dụ Dịch máy dựa trên ví dụ

Ví dụ ngữ liệu song ngữ
Tiếng ViệtTiếng Nhật
Cái ô đỏ đó giá bao nhiêu?Ano akai kasa wa ikura desu ka.
Máy ảnh nhỏ đó giá bao nhiêu?Ano chiisai kamera wa ikura desu ka.

Hệ thống EBMT được "đào tạo" từ kho ngữ liệu song ngữ có chứa nhiều cặp câu song song như ví dụ trên. Các cặp câu bao gồm một câu trong ngôn ngữ này và câu đã được sịch sang ngôn ngữ khác. Ví dụ trên là một cặp tối thiểu, có nghĩa là chỉ có một phần tử khác nhau ở 2 cặp câu. Những cặp này giúp máy học bản dịch các phần của một câu một cách dễ dàng hơn. Cụ thể, một hệ thống dịch máy EMBT sẽ học được ba đơn vị dịch từ ví dụ trên:

  1. X đó giá bao nhiêu ? tương ứng với Ano X wa ikura desu ka.
  2. ô đỏ tương ứng với akai kasa
  3. máy ảnh nhỏ tương ứng với chiisai kamera

Kết hợp các đơn vị dịch tương tự như trên là một chìa khoá cho phương án dịch mới mẻ và khả thi trong tương lai. Ví dụ, nếu ta đã được "huấn luyện" cách sử dụng một số văn bản có chứa các câu Tổng thống Kennedy bị bắn chết trong lễ duyệt binh. và Kẻ gây án đã bỏ trốn vào ngày 15/7, ta có thể dịch câu Kẻ gây án đã bị bắn chết trong lễ duyệt binh. bằng cách thay thế các bộ phận thích hợp của câu.